In [3]:
import pandas as pd
In [7]:
# DataFrame 읽기
df = pd.read_csv('example_df.csv')
df.tail()
Out[7]:
In [13]:
# Column 이름 지정
pd.read_csv('example_df.csv',
names=['완납여부', '대출액', '상환기간', '연이율', '신용등급', '연수입']).tail()
Out[13]:
In [15]:
# Column을 Index
pd.read_csv('example_df.csv',
index_col=['loan_status', 'term']).tail()
Out[15]:
In [19]:
# 구분자 지정
pd.read_csv('example_df.csv',
sep='\t').tail()
Out[19]:
In [22]:
# 특정값 NA로 취급
na_val = {'term' : [36]}
pd.read_csv('example_df.csv', na_values=na_val).head()
Out[22]:
In [23]:
# 행 생략
df.head()
Out[23]:
In [24]:
pd.read_csv('example_df.csv', skiprows=[1, 2]).head()
Out[24]:
In [31]:
# 일부 행만 읽기
df_output = pd.read_csv('example_df.csv', nrows=3)
df_output
Out[31]:
In [33]:
# file output
df_output.to_csv('df_output.csv', index=False, header=False)
In [35]:
# 인터넷 csv파일 읽기
ip_data = pd.read_csv('https://r-forge.r-project.org/scm/viewvc.php/*checkout*/pkg/fBasics/data/IP.dat.csv?revision=1&root=rmetrics&pathrev=1', sep=';')
ip_data
Out[35]:
In [37]:
import pandas_datareader.data as web
import datetime
start = datetime.datetime(2016, 1, 1)
end = datetime.datetime(2016, 12, 31)
print(start, end)
In [38]:
df = web.DataReader('005930.KS', 'yahoo', start, end)
df.tail()
Out[38]:
In [39]:
df = web.DataReader('KRX:005930', 'google', start, end)
df.tail()
Out[39]:
In [40]:
df = web.DataReader('GDP', 'fred', start, end)
df
Out[40]: